Linear Regression একটি পরিসংখ্যানগত পদ্ধতি যা একটি চলকের (dependent variable) সাথে এক বা একাধিক স্বাধীন চলকের (independent variables) সম্পর্ক বিশ্লেষণ করতে ব্যবহৃত হয়। এটি একটি সরল রেখার মাধ্যমে ডেটার মধ্যে সম্পর্কের মডেল তৈরি করে, যা ভবিষ্যদ্বাণী (prediction) এবং বিশ্লেষণের জন্য ব্যবহৃত হয়।
Linear Regression-এ, একটি চলক (Y) কে অন্য একটি বা একাধিক চলক (X) এর উপর নির্ভরশীল হিসেবে ধরা হয়। এর মাধ্যমে আমরা একটি straight line (রেখা) বের করার চেষ্টা করি, যেটি ডেটার সাথে সবচেয়ে ভালোভাবে মেলে।
Linear Regression এর মৌলিক ধারণা:
Linear Regression-এ, সাধারণত Y = β₀ + β₁X + ε ফর্মুলা ব্যবহৃত হয়, যেখানে:
- Y: নির্ভরশীল চলক বা output (dependent variable)
- X: স্বাধীন চলক বা input (independent variable)
- β₀: intercept, যা রেখার Y অক্ষের সাথে কাটানোর পয়েন্ট
- β₁: slope, যা X এর প্রতি Y এর পরিবর্তনের হার বা সম্পর্ক নির্দেশ করে
- ε: error term, যা অজ্ঞাত বা অনির্ধারিত ভ্যারিয়েবলের কারণে আগত ত্রুটি বা বিচ্যুতি নির্দেশ করে
Linear Regression এর প্রধান লক্ষ্য:
Linear Regression এর প্রধান লক্ষ্য হলো β₀ এবং β₁ এর মান বের করা, যা রেখার জন্য সর্বোত্তম ফিট তৈরি করবে। এটি Least Squares Method ব্যবহার করে করা হয়, যা ডেটার প্রতি সীমাবদ্ধতার (residuals) মোট বর্গফল (sum of squares) কমাতে সহায়ক।
Simple Linear Regression এবং Multiple Linear Regression:
- Simple Linear Regression:
- এটি একক স্বাধীন চলক (X) এবং নির্ভরশীল চলক (Y) এর মধ্যে সম্পর্ক বিশ্লেষণ করে।
- উদাহরণ: একটি ছাত্রের শিক্ষাগত ফলাফল নির্ধারণ করতে তার ক্লাসে কাটানো ঘণ্টার সাথে সম্পর্ক।
- Multiple Linear Regression:
- এটি একাধিক স্বাধীন চলক (X₁, X₂, ..., Xn) ব্যবহার করে Y এর পূর্বাভাস দেয়।
- উদাহরণ: একটি ছাত্রের পরীক্ষার ফলাফল নির্ধারণ করতে তার ক্লাসে কাটানো ঘণ্টা, পরীক্ষার প্রস্তুতির সময়, এবং অন্যান্য ফ্যাক্টর।
Linear Regression এর প্রয়োগ:
Linear Regression একটি শক্তিশালী মডেল এবং অনেক ক্ষেত্রে ব্যবহৃত হয়:
ব্যবসায়িক পূর্বাভাস (Business Forecasting):
- Linear Regression বিভিন্ন ব্যবসায়িক প্রক্রিয়া বিশ্লেষণ করতে এবং ভবিষ্যত পূর্বাভাস করতে ব্যবহৃত হয়, যেমন বিক্রয় পূর্বাভাস, বাজারের চাহিদা বিশ্লেষণ, ইত্যাদি।
উদাহরণ:
- ব্যবসায়িক বিক্রয় এবং বিজ্ঞাপন খরচের মধ্যে সম্পর্কের বিশ্লেষণ করা, যেখানে বিজ্ঞাপন খরচকে স্বাধীন চলক এবং বিক্রয়কে নির্ভরশীল চলক হিসেবে নেওয়া হয়।
- অর্থনৈতিক বিশ্লেষণ (Economic Analysis):
- অর্থনৈতিক পরিস্থিতি বিশ্লেষণ করতে Linear Regression ব্যবহার করা হয়, যেমন দেশের GDP এবং বিভিন্ন অর্থনৈতিক সূচকের (যেমন ব্যাঙ্ক সুদের হার) মধ্যে সম্পর্ক বিশ্লেষণ করা।
- স্বাস্থ্যসেবা (Healthcare):
- Linear Regression স্বাস্থ্যসেবায় রোগীর ডেটা বিশ্লেষণ করতে ব্যবহৃত হয়। উদাহরণস্বরূপ, বয়স, ওজন এবং শারীরিক সক্রিয়তার উপর ভিত্তি করে হৃদরোগের ঝুঁকি পূর্বাভাস দেওয়া।
- মেশিন লার্নিং (Machine Learning):
- Linear Regression মেশিন লার্নিং-এর একটি মৌলিক অ্যালগরিদম, যা ভবিষ্যতের মান (prediction) বের করার জন্য ব্যবহৃত হয়। এটি বিশেষ করে যখন ডেটাতে কোন সরল সম্পর্ক থাকে তখন কার্যকর।
- বিশ্লেষণমূলক গবেষণা (Analytical Research):
- গবেষকরা বিভিন্ন ভেরিয়েবল (যেমন: ছাত্রদের পরীক্ষার ফলাফল এবং তাদের অধ্যয়ন সময়ের সম্পর্ক) বিশ্লেষণ করতে Linear Regression ব্যবহার করেন।
Linear Regression উদাহরণ (Python)
এখানে একটি Simple Linear Regression উদাহরণ দেখানো হচ্ছে, যেখানে আমরা একটি ছাত্রের পরীক্ষার ফলাফল পূর্বাভাস করতে তার অধ্যয়ন সময়ের উপর ভিত্তি করে কাজ করছি:
Step 1: প্রয়োজনীয় লাইব্রেরি ইনস্টল এবং ডেটা প্রস্তুত করা
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# উদাহরণ ডেটা: শিক্ষার্থীদের অধ্যয়ন সময় এবং ফলাফল
study_hours = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]).reshape(-1, 1) # X (independent variable)
scores = np.array([35, 42, 48, 56, 60, 65, 70, 75, 80, 85]) # Y (dependent variable)
Step 2: মডেল তৈরি এবং প্রশিক্ষণ (Training the Model)
# মডেল তৈরি
model = LinearRegression()
# মডেল প্রশিক্ষণ
model.fit(study_hours, scores)
Step 3: পূর্বাভাস (Prediction)
# নতুন ডেটা পয়েন্টের জন্য পূর্বাভাস
new_study_hours = np.array([11]).reshape(-1, 1) # 11 ঘন্টা অধ্যয়ন
predicted_score = model.predict(new_study_hours)
print(f"যদি 11 ঘণ্টা অধ্যয়ন করা হয়, তবে পরীক্ষায় প্রাপ্ত স্কোর হবে: {predicted_score[0]}")
Step 4: প্লট তৈরি (Plotting)
# রৈখিক সম্পর্ক দেখানোর জন্য প্লট
plt.scatter(study_hours, scores, color='blue') # ডেটা পয়েন্ট
plt.plot(study_hours, model.predict(study_hours), color='red') # রিগ্রেশন লাইনের প্লট
plt.title('Study Hours vs Exam Score')
plt.xlabel('Study Hours')
plt.ylabel('Exam Score')
plt.show()
সারাংশ:
Linear Regression একটি সহজ এবং কার্যকরী পরিসংখ্যানগত পদ্ধতি, যা ডেটার মধ্যে সম্পর্ক বোঝার জন্য ব্যবহৃত হয়। এটি ভবিষ্যদ্বাণী করার জন্য একটি সরল রেখার সাহায্য নিয়ে কাজ করে, যেখানে একটি বা একাধিক স্বাধীন চলক (X) এর উপর নির্ভর করে একটি নির্ভরশীল চলক (Y) এর মান নির্ধারণ করা হয়। Linear Regression-এর বিভিন্ন প্রয়োগ ক্ষেত্র রয়েছে, যেমন ব্যবসা, স্বাস্থ্যসেবা, অর্থনীতি এবং মেশিন লার্নিং।
Read more